Libri > Informatica, Web e Digital Media > Scienza dei calcolatori

Cervelli menti algoritmi by Tommaso Poggio & Marco Magrini

autore:Tommaso Poggio & Marco Magrini [Poggio, Tommaso & Magrini, Marco] , Date: gennaio 4, 2024 ,vista: 89

Cervelli menti algoritmi by Tommaso Poggio & Marco Magrini

autore:Tommaso Poggio & Marco Magrini [Poggio, Tommaso & Magrini, Marco]
La lingua: ita
Format: epub
editore: SPERLING & KUPFER
pubblicato: 2023-09-27T12:00:00+00:00

Lâepopea dei modelli di linguaggio

Nel 2017, Google pubblica il famoso articolo sui transformer. Nel 2019, OpenAI presenta GPT-2, da molti considerato come il primo language model sufficientemente large, con un miliardo e mezzo di parametri, ovvero di Â«pesiÂ» calcolati durante la fase di training. Nel 2020, Google annuncia il suo LLM chiamato LaMDA, poi sviluppato in tre modelli, il piÃ¹ grande dei quali ha 137 miliardi di parametri. Nel 2022, oltre ai primi modelli a diffusione come DALL-E, Stable Diffusion e il popolare Midjourney, compare GPT-3.5 con i suoi 175 miliardi di parametri. Il numero dei parametri della versione GPT-4 non Ã¨ stato rivelato, ma qualcuno dice che si aggiri sui 1.000 miliardi.

Lâavvento delle tecnologie generative ha repentinamente cambiato lo scenario della AI, che si Ã¨ in qualche modo allontanata dal modello neurobiologico del cervello umano: Ã¨ diminuita lâimportanza dellâalgoritmo ed Ã¨ aumentata quella dei dati. Un uomo impiegherebbe migliaia di anni per leggere tutto quel che GPT ha digerito.

Come giÃ detto, Â«GPTÂ» sta per Generative Pre-trained Transformer. Il transformer Ã¨ il modello di rete neuronale. Ã generativo perchÃ© il suo mestiere Ã¨ quello di predire la parola da usare sulla base delle parole che la precedono. Ed Ã¨ pre-trained perchÃ© viene allenato ad autoprodurre un microcosmo di relazioni fra le parole, dandogli in pasto la massima quantitÃ di dati possibile, che lui masticherÃ per giorni e settimane con i denti di centinaia di GPU e TPU, fino a digerire una bella fetta delle conoscenze umane.

Questo microcosmo di parole Ã¨ effettivamente rappresentato nello spazio geometrico sotto forma di vettori, abitualmente usati in matematica per quantitÃ che non possono essere espresse con un solo numero. Se prendo le parole Â«zebraÂ», Â«pipistrelloÂ» e Â«serpenteÂ», tutte e tre appartengono alla categoria Â«animaleÂ», due soltanto a Â«mammiferoÂ» e una soltanto a Â«sa volareÂ». Queste relazioni vengono codificate nei vettori sotto forma di punti nello spazio, dove piÃ¹ le parole sono associate piÃ¹ sono vicine fra loro. Ora, noi siamo abituati a concepire un punto nello spazio bidimensionale degli assi cartesiani o nello spazio tridimensionale nel quale viviamo. Qui, invece, per contenere le molteplici relazioni fra le parole nei loro molteplici significati Ã¨ necessario usare uno spazio multidimensionale, impossibile da visualizzare graficamente.

OpenAI non ha rivelato quali sorgenti abbia utilizzato per il training di GPT-3. Si dÃ per scontato che abbia usato i migliori dataset di puro testo disponibili. Si comincia con CommonCrawl, che dal 2018 scannerizza e conserva il contenuto di pagine web, incluse quelle che nel frattempo sono state cancellate. Poi câÃ¨ WebText, un corpus di dati ricavati dalla stessa OpenAI collezionando 45 milioni dei link piÃ¹ votati su Reddit, un popolare sito di discussione e di aggregazione di notizie. Book1 e Book2 sono due dataset che contengono un numero enorme di libri disponibili online e non soggetti a copyright. Infine, câÃ¨ ovviamente Wikipedia, la grande enciclopedia multilingue scritta e verificata gratuitamente dagli utenti. Ma Ã¨ verosimile che ci sia molto, molto di piÃ¹.

Prendiamo il caso di Google Books. Nel 2004 Google si lancia

scaricare

Cervelli menti algoritmi by Tommaso Poggio & Marco Magrini.epub

Disconoscimento:
Questo sito non memorizza alcun file sul suo server. Abbiamo solo indice e link contenuto fornito da altri siti. Contatta i fornitori di contenuti per rimuovere eventuali contenuti di copyright e inviaci un'email. Cancelleremo immediatamente i collegamenti o il contenuto pertinenti.

le categorie

Certificazioni	Computer e videogiochi
Database	Hardware
Internet	Multimedia e disegno grafico
Programmazione	Reti e sistemi amministrativi
Scienza dei calcolatori	Sicurezza informatica
Sistemi operativi	Software per l'ufficio

Ebooks popolari

Pensare l'infosfera by Luciano Floridi(1453)
La quarta rivoluzione. Come l'infosfera sta trasformando il mondo by Luciano Floridi(1435)
Lolita by Unknown(1167)
Il verde e il blu by Luciano Floridi(1069)
Alan Turing: The Imitation Game - Storia di un enigma by Hodges Andrew(1039)
Alan Turing by Andrew Hodges(935)
Fisica del futuro by Michio Kaku(866)
Una di Luna (Italian Edition) by Andrea De Carlo(842)
Singolarità by David Orban(809)
65 (Nero Edizioni) by Alexandre Laumonier(768)
Superintelligenza by Nick Bostrom(757)
L’informazione by James Gleick(726)
Fisica I by Unknown(720)
65 by Alexandre Laumonier(714)
Psicologia dei videogiochi by Stefano Triberti Luca Argenton(691)
Galatea 2.2 by Richard Powers(669)
La vita tra reale e virtuale. Meet the media guru by Zygmunt Bauman(665)
Machine Learning - una introduzione dettagliata: Un libro destinato a chi vuol addentrarsi nello studio del machine learning (Italian Edition) by Francesco Scala(659)
La biblioteca senza libri by David A. Bell(646)
My World by Peter Sagan(638)